Mediante la exploración y visualización de datos, se evidenció ….
Todo delito trae consigo una serie de inconvenientes o sufrimiento para una o más personas. Por esto y más siempre ha sido de interés para el humano el estudio de diversos delitos. Lo ideal sería poder predecir estos actos para así evitar los daños generados, pero lamentablemente esto no es posible debido a la gran aleatoriedad de los actos de las personas. Aunque no se puede tener certeza de que se cometerá un delito, sí se puede tratar de encontrar un patrón espacial.
Es por esto que buscamos analizar los distintos niveles de delitos por comuna de la Región Metropolitana y relacionarlos con distintas variables comunales, como son el porcentanje de hacinamiento, la cantidad de habitantes por vivienda, el índice de masculinidad poblacional, nivel de escolaridad del jefe de hogar, entre otras. Queremos responder preguntas como ¿Existirán patrones identificables de los tipos de delitos según las diversas variables comunales? ¿Hay relación entre algunos delitos y el nivel de de hacinamiento? ¿Tiene incidencia el nivel educacional del jefe de hogar? ¿Qué delitos sí y cuáles no?
Además, dado que tenemos información espacial ¿Podremos predecir futuros lugares conflictivos según la evidencia de evolución temporal? o ¿Existirán relaciones en los resultados alcanzados entre las unidades vecinales (comunas)?
Las conclusiones obtenidas podrían usarse para que cada comuna genere medidas preventivas desde su realidad, al tomar conocimiento de las variables que propician estos delitos.
En este estudio utilizaremos los datos del Centro de Estudios y Análisis del Delito CEAD para los delitos clasificados como: Consumo de alcohol en la vía pública, ruidos molestos, abusos sexuales y otros delitos sexuales, violencia intrafamiliar contra el adulto mayor, contra la mujer y contra el niño. También, usaremos datos del CENSO 2017 provenientes de INE.
En las siguientes tablas podremos ver la descripción de nuestras variables a estudiar:
| Variable | Tipo de variable | Descripción |
|---|---|---|
| COMUNA | Categórica | Nombre de la comuna |
| ALCOHOL | Numérica | Cantidad de denuncias por delitos de consumo de alcohol en la vía pública |
| RUIDO | Numérica | Cantidad de denuncias por delitos de ruidos molestos |
| ABUSO | Numérica | Cantidad de denuncias por abusos sexuales y otros delitos sexuales |
| VIO.ADULT | Numérica | Cantidad de denuncias por delitos de violencia intrafamiliar a adulto mayor |
| VIO.MUJ | Numérica | Cantidad de denuncias por delitos de violencia intrafamiliar a mujer |
| VIO.NIN | Numérica | Cantidad de denuncias por delitos de violencia intrafamiliar a niño/a |
| ANIO | Numérica | Año de las denuncias (2010 al 2017) |
| Variable | Tipo de variable | Descripción |
|---|---|---|
| Comuna | Categórica | Nombre de la comuna |
| POB | Numérica | Número de habitantes |
| VIV | Numérica | Número de viviendas |
| HACI | Numérica | Porcentaje de viviendas con hacinamiento |
| MASCU | Numérica | Índice de Masculinidad (hombres cada 100 mujeres) |
| ESC | Numérica | Años de escolaridad promedio del jefe o jefa de hogar |
Iniciaremos nuestra investigación realizando un análisis previo mediante visualizaciones para observar posibles patrones, asociaciones y correlaciones a través de corrplots, variogramas, correlogramas y gráficas de dispersión, además de usar diversos test de asociación espacial.
Posteriormente, construiremos modelos espacio temporales para datos de área (CARBayes), revisaremos a través de clusters algo JALDKJ y relizaremos predicciones espaciales (kriging)
Será necesario poner librerias???
Tanto el test de Moran como el Geary nos dicen que existe autocorrelación espacial.
##
## Moran I test under randomisation
##
## data: D2017$HACI
## weights: b_pesos
##
## Moran I statistic standard deviate = 4.3137, p-value = 8.028e-06
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.321553577 -0.019607843 0.006254985
##
## Geary C test under randomisation
##
## data: D2017$HACI
## weights: b_pesos
##
## Geary C statistic standard deviate = 3.4968, p-value = 0.0002354
## alternative hypothesis: Expectation greater than statistic
## sample estimates:
## Geary C statistic Expectation Variance
## 0.656486030 1.000000000 0.009650427
Se generó una nueva variables ´Pob_Viv´ que resume la población y la cantidad de viviendas de la comuna. Para esta variable tanto el test de Moran como el Geary nos dicen que existe autocorrelación espacial.
##
## Moran I test under randomisation
##
## data: D2017$Pob_Viv
## weights: b_pesos
##
## Moran I statistic standard deviate = 4.1575, p-value = 1.609e-05
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.308628430 -0.019607843 0.006233298
##
## Geary C test under randomisation
##
## data: D2017$Pob_Viv
## weights: b_pesos
##
## Geary C statistic standard deviate = 2.8629, p-value = 0.002099
## alternative hypothesis: Expectation greater than statistic
## sample estimates:
## Geary C statistic Expectation Variance
## 0.71420053 1.00000000 0.00996565
Tanto el test de Moran como el Geary nos dicen que existe autocorrelación espacial.
##
## Moran I test under randomisation
##
## data: D2017$MASCU
## weights: b_pesos
##
## Moran I statistic standard deviate = 2.8791, p-value = 0.001994
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.201845285 -0.019607843 0.005916503
##
## Geary C test under randomisation
##
## data: D2017$MASCU
## weights: b_pesos
##
## Geary C statistic standard deviate = 2.9365, p-value = 0.00166
## alternative hypothesis: Expectation greater than statistic
## sample estimates:
## Geary C statistic Expectation Variance
## 0.64554653 1.00000000 0.01457023
Tanto el test de Moran como el Geary nos dicen que existe autocorrelación espacial.
##
## Moran I test under randomisation
##
## data: D2017$ESC
## weights: b_pesos
##
## Moran I statistic standard deviate = 6.7455, p-value = 7.626e-12
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic Expectation Variance
## 0.508872193 -0.019607843 0.006138077
##
## Geary C test under randomisation
##
## data: D2017$ESC
## weights: b_pesos
##
## Geary C statistic standard deviate = 5.1669, p-value = 1.19e-07
## alternative hypothesis: Expectation greater than statistic
## sample estimates:
## Geary C statistic Expectation Variance
## 0.44954254 1.00000000 0.01134968
Todas las variables comunales de la base CENSO 2017 tienen autocorrelación espacial.